www.ise.kiev.ua
 ≤стор≥¤ кафедри •    
¬икладач≥ • 
ћаг≥стерськ≥    програми •
 ниги •    
ѕроекти •         

 

 

 

 

 

 

 

 

 

 

ѕ”ЅЋ≤ ј÷≤ѓ --> “ези виступ≥в

на II≤ ¬сеукрањнськ≥й науков≥й студентськ≥й конференц≥њ "ѕроблеми впровадженн¤ ≥нформац≥йних систем ≥ технолог≥й в економ≥ц≥ ≥ б≥знес≥" 5 - 7 листопада 2002 р.

 

 ловська ё.ћ.

 ињвський нац≥ональний економ≥чний ун≥верситет

DATA MINING я  ¬ј∆Ћ»¬»… ≤Ќ—“–”ћ≈Ќ“ ќ“–»ћјЌЌя ƒјЌ»’

Ќа сьогодн≥шньому етап≥ розвитку ≥нформац≥йних систем ≥ технолог≥й все част≥ше доводитьс¤ усв≥домлювати, що без продуктивноњ обробки, потоки УсирихФ даних утворюють н≥кому не потр≥бне УзвалищеФ даних. —пециф≥ка сучасних вимог до обробки даних пол¤гаЇ у наступному: дан≥ мають необмежений обс¤г; дан≥ Ї р≥знор≥дними (к≥льк≥сн≥, ¤к≥сн≥, текстов≥); результати мають бути конкретними та зрозум≥лими; ≥нструменти дл¤ обробки сирих даних мають бути простими дл¤ застосуванн¤.

” вир≥шенн≥ ц≥Їњ проблеми не останнЇ м≥сце належить технолог≥њ здобуванн¤ даних Data Mining. ¬ ц≥лому технолог≥ю Data Mining достатньо точно визначаЇ √ригор≥й ѕ≥атецький-Ўап≥ро: Data Mining Ц це процес ви¤вленн¤ в сирих даних ран≥ше нев≥домих, нетрив≥альних, практично корисних та доступних дл¤ ≥нтерпретац≥њ знань, що необх≥дн≥ дл¤ прийн¤тт¤ р≥шень у р≥зноман≥тних сферах людськоњ д≥¤льност≥.

¬ид≥л¤ють пТ¤ть тип≥в стандартних законом≥рностей, що дозвол¤ють ви¤вл¤ти методи Data Mining: асоц≥ац≥¤, посл≥довн≥сть, класиф≥кац≥¤, кластеризац≥¤ та прогнозуванн¤.

¬≥дносно Data Mining в≥дом≥ наступн≥ класи ≥нтелектуального анал≥зу даних: 1) предметно-ор≥Їнтован≥ анал≥тичн≥ системи; 2) статистичн≥ пакети; 3) нейронн≥ мереж≥; 4) системи м≥ркувань на основ≥ аналог≥чних р≥шень; 5) дерева р≥шень; 6) еволюц≥йне програмуванн¤; 7) генетичн≥ алгоритми; 8) алгоритми обмеженого перебору.

Ќеобх≥дно в≥дм≥тити, що сфера застосуванн¤ Data Mining практично необмежена Ц вона скр≥зь, де Ї будь-¤к≥ дан≥. ¬ основному системи Data Mining застосовуютьс¤ у 2-х напр¤мках: 1) ¤к масовий продукт дл¤ б≥знес-додатк≥в; 2) ¤к ≥нструмент дл¤ проведенн¤ ун≥кальних досл≥джень. Ќа сьогодн≥ варт≥сть масового продукту с¤гаЇ 1-10 тис.дол.  ≥льк≥сть ≥нстал¤ц≥й масових продукт≥в за ≥снуючими даними дос¤гаЇ дес¤тк≥в тис¤ч.

Ћ≥дери Data Mining повТ¤зують майбутнЇ цих систем з використанн¤м њх ¤к ≥нтелектуальних додатк≥в, вбудованих в корпоративн≥ сховища даних.

Ќе дивл¤чись на к≥льк≥сть метод≥в Data Mining, пр≥оритет все б≥льше зм≥щуЇтьс¤ в сторону лог≥чних алгоритм≥в пошуку даних if-then алгоритм≥в. « њх допомогою вир≥шуютьс¤ задач≥ прогнозуванн¤, класиф≥кац≥њ, розп≥знаванн¤ образ≥в, сегментац≥њ Ѕƒ, вилученн¤ з даних прихованих знань, ≥нтерпретац≥њ даних, встановленн¤ асоц≥ац≥й в Ѕƒ та ≥нше.

–езультати таких алгоритм≥в Ї ефективними та легко ≥нтерпретуютьс¤. –азом з тим, головною проблемою лог≥чних метод≥в ви¤вленн¤ законом≥рностей Ї проблема перебору вар≥ант≥в за обмежений час. ¬≥дом≥ методи або штучно обмежують такий перебор, або будують дерева р≥шень, що мають принципов≥ обмеженн¤ ефективност≥ пошуку if-then правил.

≤нший недол≥к повТ¤заний з тим, що в≥дом≥ методи пошуку лог≥чних правил не п≥дтримують функц≥ю узагальненн¤ ви¤влених правил та функц≥ю пошуку оптимальноњ композиц≥њ таких правил.

”сп≥шне вир≥шенн¤ вказаних проблем може становити предмет нових конкурентоздатних розробок. Ќеобх≥дно також п≥дкреслити, що ринок систем Data Mining активно розвиваЇтьс¤. ” цьому процес≥ беруть участь практично вс≥ велик≥ корпорац≥њ, тому саме продукти системи Data Mining Ї одним з найперспективн≥ших напр¤мк≥в розвитку ринку ≥нформац≥йних систем та технолог≥й.

 

 
© Irina Kozak 2002
Сайт управляется системой uCoz